CNN মডেল Training এবং Performance Evaluation

Machine Learning - কেরাস ডিপ লার্নিং (Deep Learning with Keras) - Convolutional Neural Networks (CNN)
304

Convolutional Neural Networks (CNNs) হল ডীপ লার্নিং এর একটি শক্তিশালী মডেল যা প্রধানত চিত্র (Image) বিশ্লেষণ, কম্পিউটার ভিশন এবং অডিও সিগন্যাল প্রসেসিং এর জন্য ব্যবহৃত হয়। CNN মডেল ট্রেনিং এবং এর কর্মক্ষমতা মূল্যায়ন করার জন্য কিছু বিশেষ পদক্ষেপ রয়েছে। এখানে CNN মডেল ট্রেনিং এবং পারফরম্যান্স ইভালুয়েশনের পুরো প্রক্রিয়া নিয়ে বিস্তারিত আলোচনা করা হল।

CNN মডেল ট্রেনিং

CNN মডেল ট্রেনিং এর প্রক্রিয়া সাধারণত কয়েকটি স্তরে ভাগ করা যায়:

  1. ডেটা প্রিপ্রসেসিং (Data Preprocessing):
    • CNN মডেল ট্রেনিংয়ের প্রথম পদক্ষেপ হল ইনপুট ডেটার প্রিপ্রসেসিং। এটি অন্তর্ভুক্ত করে:
      • ডেটা রিসাইজিং: চিত্রের আকার সমন্বয় করা।
      • স্কেলিং বা নরমালাইজেশন: পিক্সেল মানের স্কেলিং।
      • ডেটা অগমেন্টেশন: চিত্রের ঘুরানো, বড় করা, ক্রপিং ইত্যাদি।
  2. মডেল আর্কিটেকচার ডিজাইন (Model Architecture Design): CNN মডেল সাধারণত ৩টি ধরনের স্তর ব্যবহার করে:

    • কনভোলিউশনাল লেয়ার (Convolutional Layer): ইনপুট ইমেজ থেকে ফিচার এক্সট্র্যাকশন করে।
    • পুলিং লেয়ার (Pooling Layer): চিত্রের ডাইমেনশন কমিয়ে ফিচার সংক্ষেপণ করে।
    • ফুলি কানেক্টেড লেয়ার (Fully Connected Layer): মডেলের সিদ্ধান্ত গ্রহণের জন্য ফিচারগুলিকে একত্রিত করে।

    উদাহরণস্বরূপ একটি CNN আর্কিটেকচার:

    from keras.models import Sequential
    from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
    
    model = Sequential()
    
    # কনভোলিউশনাল লেয়ার
    model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)))
    
    # পুলিং লেয়ার
    model.add(MaxPooling2D(pool_size=(2, 2)))
    
    # আরেকটি কনভোলিউশনাল লেয়ার
    model.add(Conv2D(64, (3, 3), activation='relu'))
    
    # আরও পুলিং লেয়ার
    model.add(MaxPooling2D(pool_size=(2, 2)))
    
    # ফ্ল্যাট লেয়ার
    model.add(Flatten())
    
    # ফুলি কানেক্টেড লেয়ার
    model.add(Dense(128, activation='relu'))
    model.add(Dense(10, activation='softmax'))  # 10টি ক্লাসের জন্য
    
  3. মডেল কম্পাইলিং (Model Compilation): মডেল ট্রেনিংয়ের জন্য অপটিমাইজার, লস ফাংশন, এবং মেট্রিক নির্ধারণ করা হয়। সাধারণত চিত্র শ্রেণীকরণের জন্য categorical_crossentropy এবং অপটিমাইজার হিসেবে Adam ব্যবহার করা হয়।

    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    
  4. মডেল ট্রেনিং (Model Training): মডেল ট্রেনিং শুরু করা হয় fit() মেথড ব্যবহার করে। ইনপুট ডেটা (x_train), টার্গেট আউটপুট (y_train), ব্যাচ সাইজ, এবং ইপোকস এর সংখ্যা নির্ধারণ করা হয়।

    history = model.fit(x_train, y_train, batch_size=32, epochs=10, validation_data=(x_val, y_val))
    

CNN মডেল Performance Evaluation

CNN মডেলের পারফরম্যান্স ইভালুয়েশন বেশ কিছু গুরুত্বপূর্ণ ধাপে বিভক্ত:

  1. ইভালুয়েশন ডেটার উপর মডেল ইভালুয়েশন (Model Evaluation on Test Data): প্রশিক্ষণ শেষ হওয়ার পর, মডেলটি evaluate() মেথড ব্যবহার করে ইভালুয়েশন ডেটাতে পরীক্ষিত হয়। এটি মডেলটির লস এবং নির্ধারিত মেট্রিক্স (যেমন, accuracy) পরিমাপ করে।

    loss, accuracy = model.evaluate(x_test, y_test)
    print(f"Test Loss: {loss}")
    print(f"Test Accuracy: {accuracy}")
    
  2. কনফিউশন ম্যাট্রিক্স (Confusion Matrix): কনফিউশন ম্যাট্রিক্স একটি টুল যা মডেলটির ক্লাসিফিকেশন পারফরম্যান্স পরিমাপ করতে ব্যবহৃত হয়। এটি ভুল এবং সঠিক শ্রেণীবিভাজন শনাক্ত করতে সহায়ক।

    from sklearn.metrics import confusion_matrix
    import numpy as np
    
    y_pred = model.predict(x_test)
    y_pred_classes = np.argmax(y_pred, axis=1)
    y_true = np.argmax(y_test, axis=1)
    
    cm = confusion_matrix(y_true, y_pred_classes)
    print(cm)
    
  3. প্রিসিশন, রিকল, এবং F1 স্কোর (Precision, Recall, and F1-Score): মডেল পারফরম্যান্সের আরও উন্নত বিশ্লেষণ প্রিসিশন, রিকল এবং F1 স্কোর ব্যবহার করে করা যায়। এগুলি বিশেষভাবে গুরুত্বপূর্ণ যখন ক্লাস ইমব্যালেন্স থাকে।

    from sklearn.metrics import precision_score, recall_score, f1_score
    
    precision = precision_score(y_true, y_pred_classes, average='weighted')
    recall = recall_score(y_true, y_pred_classes, average='weighted')
    f1 = f1_score(y_true, y_pred_classes, average='weighted')
    
    print(f"Precision: {precision}")
    print(f"Recall: {recall}")
    print(f"F1 Score: {f1}")
    
  4. ROC কিউরভ এবং AUC (ROC Curve and AUC): Receiver Operating Characteristic (ROC) কিউরভ এবং Area Under the Curve (AUC) হল ক্লাসিফিকেশন মডেলের পারফরম্যান্স পরিমাপের জন্য গুরুত্বপূর্ণ মেট্রিক্স। এটি কনফিউশন ম্যাট্রিক্সের চেয়ে আরও বিস্তৃত মূল্যায়ন প্রদান করে।

    from sklearn.metrics import roc_curve, auc
    import matplotlib.pyplot as plt
    
    fpr, tpr, thresholds = roc_curve(y_true, y_pred[:,1])
    roc_auc = auc(fpr, tpr)
    
    plt.figure()
    plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
    plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
    plt.xlim([0.0, 1.0])
    plt.ylim([0.0, 1.05])
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('Receiver Operating Characteristic')
    plt.legend(loc="lower right")
    plt.show()
    
  5. Loss and Accuracy Visualization: মডেল ট্রেনিংয়ের সময় প্রশিক্ষণ এবং ভ্যালিডেশন লস এবং একুরেসি মেট্রিক্সের গ্রাফ তৈরি করা মডেলের উন্নতি পর্যালোচনায় সহায়ক।

    import matplotlib.pyplot as plt
    
    plt.plot(history.history['accuracy'])
    plt.plot(history.history['val_accuracy'])
    plt.title('Model Accuracy')
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.legend(['Train', 'Val'], loc='upper left')
    plt.show()
    
    plt.plot(history.history['loss'])
    plt.plot(history.history['val_loss'])
    plt.title('Model Loss')
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.legend(['Train', 'Val'], loc='upper left')
    plt.show()
    

সারাংশ

CNN মডেল ট্রেনিং এবং পারফরম্যান্স ইভালুয়েশন হল একটি গুরুত্বপূর্ণ প্রক্রিয়া যা মডেলটির কার্যকারিতা পরিমাপ এবং অপটিমাইজেশনে সহায়ক। মডেল ট্রেনিংয়ের জন্য ডেটা প্রিপ্রসেসিং, আর্কিটেকচার ডিজাইন, কম্পাইল এবং ফিট মেথড ব্যবহার করা হয়, এবং পারফরম্যান্স ইভালুয়েশনের জন্য কনফিউশন ম্যাট্রিক্স, প্রিসিশন, রিকল, F1 স্কোর, এবং ROC কিউরভ ব্যবহার করা হয়।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...